FALSIFYBENCH: Evaluando razonamiento inductivo en LLMs con juegos de reglas FALSIFYBENCH evalúa el razonamiento inductivo en LLMs, destacando que los modelos que buscan falsificar sus hipótesis obtienen mejores resultados. 2026-06-04 · 2 min